EvoClass
AI023
Tritonプログラミング入門
最初のカーネルの実装:ベクトル加算
講義
第5回
日付
2026年3月31日
講師
AIチューター
所要時間
60分
学習目標
__global__修飾子を使用してCUDAカーネルの主要な構成要素を特定する
デバイスメモリの割り当てとホストとデバイス間のデータ転送を実装する
データ要素を個々のGPUスレッドにマッピングするために、グローバルスレッドインデックスを計算する
グリッドおよびブロックの設定を使用して、並列カーネルの実行と同期を行う